% Version control information:
%$HeadURL: http://practicas-spss.googlecode.com/svn/trunk/regresion_no_lineal/regresion_no_lineal.tex $
%$LastChangedDate: 2010-09-27 14:37:11 +0000 (Mon, 27 Sep 2010) $
%$LastChangedRevision: 3 $
%$LastChangedBy: asalber $
%$Id: regresion_no_lineal.tex 3 2010-09-27 14:37:11Z asalber $

\chapter{Regresión no lineal}

\section{Fundamentos teóricos}
La regresión simple tiene por objeto la construcción de un modelo
funcional $y=f(x)$ que explique lo mejor posible la relación entre
dos variables $Y$ (variable dependiente) y $X$ (variable
independiente) medidas en una misma muestra.

Ya vimos que, dependiendo de la forma de esta función, existen muchos tipos de regresión simple. Entre los más habituales están:
\begin{center}
\begin{tabular}{|l|c|}
\hline
 Tipo de modelo      &     Ecuación genérica      \\
\hline\hline
 Lineal                  &          $y=a+bx$          \\
\hline
 Parabólico              &       $y=a+bx+cx^2$        \\
\hline
 Polinómico de grado $n$ & $y=a_0+a_1x+\cdots+a_nx^n$ \\
\hline
 Potencial               &       $y=ax^b$       \\
\hline
 Exponencial             &     $y=ca^{bx}$      \\
\hline
 Logarítmico             &       $y=c\log_abx$        \\
\hline
\end{tabular}
\end{center}

La elección de un tipo de modelo u otro suele hacerse según la forma
de la nube de puntos del diagrama de dispersión. A veces estará
claro qué tipo de modelo se debe construir, tal y como ocurre en los
diagramas de dispersión de la figura~\ref{g:tiposrelaciones2}. Pero
otras veces no estará tan claro, y en estas ocasiones, lo normal es
ajustar los dos o tres modelos que nos parezcan más convincentes,
para luego quedarnos con el que mejor explique la relación entre $Y$
y $X$, mirando el coeficiente de determinación\footnote{Ver la
práctica de correlación.} de cada modelo.

\begin{figure}[h!]
\centering 
\subfigure[Sin relación.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_sin_relacion}}}\qquad
\subfigure[Relación lineal.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_lineal}}}\qquad
\subfigure[Relación polinómica.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_parabolica}}}\\
\subfigure[Relación exponencial.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_exponencial}}}\qquad
\subfigure[Relación logarítmica.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_logaritmica}}}\qquad
\subfigure[Relación inversa.]{\scalebox{0.5}{\input{regresion_lineal_simple/img/diagrama_dispersion_relacion_inversa}}}\\
\caption{Diagramas de dispersión correspondientes a distintos tipos de relaciones
entre variables.} \label{g:tiposrelaciones2}
\end{figure}

Ya vimos en la práctica sobre regresión lineal simple, cómo
construir rectas de regresión. En el caso de que optemos por ajustar
un modelo no lineal, la construcción del mismo puede realizarse
siguiendo los mismos pasos que en el caso lineal. Básicamente se
trata de determinar los parámetros del modelo que minimizan la suma
de los cuadrados de los residuos en $Y$. En los modelos
multiplicativo y exponencial, el sistema aplica transformaciones
logarítmicas a las variables y después ajusta un modelo lineal a los
datos transformados. En el modelo recíproco, el sistema sustituye la
variable dependiente por su recíproco antes de estimar la ecuación
de regresión.


\section{Ejercicios resueltos}
\begin{enumerate}[leftmargin=*]
\item En un experimento se ha medido el número de bacterias por unidad de volumen en un cultivo, cada hora transcurrida, obteniendo los siguientes resultados:
\begin{center}
\begin{tabular}{c|ccccccccc}
Horas & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8  \\
\hline
Nº Bacterias & 25 & 32 & 47 & 65 & 92 & 132 & 190 & 275 & 362
\end{tabular}
\end{center}

Se pide:
\begin{enumerate}
\item  Crear las variables \variable{horas} y \variable{bacterias} e introducir estos datos.

\item  Dibujar el diagrama de dispersión correspondiente. En vista del diagrama, ¿qué tipo de modelo crees que
explicará mejor la relación entre el número de bacterias y el tiempo transcurrido?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Gráficos->Dispersión...}, elegir la opción \opcion{simple} y  hacer click sobre el botón
\boton{Definir}.
\item Seleccionar la variable \variable{bacterias} en el campo \campo{Eje Y} del cuadro de diálogo. 
\item Seleccionar la variable \variable{horas} en el campo \campo{Eje X} del cuadro de diálogo y hacer click sobre el
botón \boton{Aceptar}.
\end{enumerate}}
\end{indicacion}

\item Hacer una comparativa de los distintos modelos de regresión en función del coeficiente de determinación. ¿Qué
tipo de modelo es el mejor?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Analizar->Regresión->Estimación Curvilínea...}.
\item Seleccionar la variable \variable{bacterias} en el campo \campo{Dependiente} del cuadro de diálogo.
\item Seleccionar la variable \variable{horas} en el campo \campo{Independientes} del cuadro de diálogo.
\item Desmarcar la opción \opcion{Representar los modelos}.
\item Marcar, por ejemplo, las opciones que más se ajusten a la foma de la nube de puntos del diagrama de
dispersión y hacer click sobre el botón \texttt{Aceptar}.
\end{enumerate}}
\end{indicacion}
\item En  vista de lo anterior, calcular el modelo de regresión que mejor explique la relación entre
\variable{bacterias} y \variable{horas}.
\begin{indicacion}{
Utilizar los coeficientes que aparecen en el punto anterior y la tabla de la parte de fundamentos teóricos.}
\end{indicacion}

\item Según el modelo anterior, ¿cuántas bacterias habrá al cabo de 3 horas y media del inicio del cultivo? ¿Y al cabo
de 10 horas? ¿Son fiables estas predicciones?
\begin{indicacion}{
\begin{enumerate}
\item Crear una nueva variable \variable{valores horas} e introducir los valores de las horas para los que queremos
predecir las bacterias.
\item Seleccionar el menú \texttt{Transformar->Calcular...}.
\item Introducir el nombre de la nueva variable \varible{prediccion bacterias} en el campo \campo{Variable de destino}
del cuadro de diálogo.
\item Introducir la ecuación del mejor modelo en el campo \campo{Expresión numérica}, utilizando los coeficientes
correspondientes y la variable \variable{valores alcohol} y hacer click sobre el botón \boton{Aceptar}.
\end{enumerate}}
\end{indicacion}

\item Dar una predicción lo más fiable posible del tiempo que tendría que transcurrir para que en el cultivo hubiese 100
bacterias.
\begin{indicacion}{
Repetir los pasos del apartado anterior introduciendo la variable \variable{horas} en el campo \campo{Dependiente} y
la variable \variable{bacterias} en el campo \campo{Independientes}}.
\end{indicacion}
\end{enumerate}

\item Se han medido dos variables $S$ y $T$ en 10 individuos, obteniéndose los siguientes resultados:
\begin{center}
$(-1.5 \,,\, 2.25)$\,,\, $(0.8 \,,\, 0.64)$\,,\, $(-0.2 \,,\, 0.04)$\,,\, $(-0.8 \,,\, 0.64)$\,,\, $(0.4 \,,\, 0.16)$\,,\,\\
$(0.2 \,,\, 0.04)$\,,\, $(-2.1 \,,\, 4.41)$\,,\, $(-0.4 \,,\, 0.16)$\,,\, $(1.5 \,,\, 2.25)$\,,\, $(2.1 \,,\,
4.41)$.
\end{center}
Se pide:
\begin{enumerate}
\item  Crear las variables \variable{S} y \variable{T} e introducir estos datos.
\item Calcular la recta de regresión de \variable{T} sobre \variable{S}. Dibujar dicha recta sobre el diagrama de
dispersión. ¿Podemos afirmar que $S$ y $T$ son independientes?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Analizar->Regresión->Lineal...}.
\item Seleccionar la variable \variable{T} en el campo \variable{Dependiente} del cuadro de diálogo.
\item Seleccionar la variable \variable{S} en el campo \campo{Independiente} del cuadro de diálogo y hacer click sobre
el botón \boton{Aceptar}.
\item Para escribir la recta, observaremos en la ventana de resultados obtenida, la tabla denominada
\resultado{Coeficientes}, y en la columna \resultado{B} de los \resultado{Coeficientes no estandarizados}, encontramos
en la primera fila la \resultado{constante} de la recta y en la segunda la \resultado{pendiente}.
\item Seleccionar el menú \menu{Gráficos->Dispersión...}, elegir la opción \opcion{simple} y  hacer click sobre el
botón \boton{Definir}. 
\item Seleccionar la variable \variable{T} en el campo \campo{Eje Y} del cuadro de diálogo. 
\item Seleccionar la variable \variable{S} en el campo \campo{Eje X} del cuadro de diálogo y hacer click sobre el botón
\texttt{Aceptar}.
\item Editar el gráfico realizado anteriormente haciendo un doble click sobre él.
\item Seleccionar los puntos haciendo click sobre alguno de ellos.
\item Seleccionar el menú \menu{Gráfico->Añadir elemento de gráfico->Linea de ajuste total} (También se podría usar
en lugar del menu, la barra de herramientas) 
\item Cerrar el editor de gráficos, cerrando la ventana.
\end{enumerate}}
\end{indicacion}

\item Hacer una comparativa de los distintos modelos de regresión en función del coeficiente de determinación. ¿Qué
tipo de relación existe entre $S$ y $T$?
\begin{indicacion}{
\begin{enumerate}
\item Seleccionar el menú \menu{Analizar->Regresión->Estimación Curvilínea...}.
\item Seleccionar la variable \variable{T} en el campo \campo{Dependiente} del cuadro de diálogo.
\item Seleccionar la variable \variable{S} en el campo \texttt{Independientes} del cuadro de diálogo.
\item Desmarcar la opción \opcion{Representar los modelos}.
\item Marcar, por ejemplo, las opciones que más se ajusten a la foma de la nube de puntos del diagrama de
dispersión y hacer click sobre el botón \texttt{Aceptar}. 
\end{enumerate}}
\end{indicacion}

\item En vista de lo anterior, ajustar el modelo de regresión más apropiado.
\begin{indicacion}{
Utilizar los coeficientes que aparecen en el punto anterior y la tabla de la parte de fundamentos teóricos.}
\end{indicacion}
\end{enumerate}

\end{enumerate}


\section{Ejercicios propuestos}
\begin{enumerate}[leftmargin=*]
\item En un centro dietético se está probando una nueva dieta de adelgazamiento en una
muestra de 12 individuos. Para cada uno de ellos se ha medido el número de días que
lleva con la dieta y el número de kilos perdidos desde entonces, obteniéndose los
siguientes resultados:
\begin{center}
(33 , 3.9), (51 , 5.9), (30 , 3.2), (55 , 6.0), (38 , 4.9), (62 , 6.2),\\
(35 , 4.5), (60 , 6.1), (44 , 5.6), (69 , 6.2), (47 , 5.8), (40 , 5.3)
\end{center}
Se pide:
\begin{enumerate}
  \item Dibujar el diagrama de dispersión. Según la nube de puntos, ¿qué tipo de
  modelo explicaría mejor la relación entre los kilos perdidos y los días de dieta?
  \item Construir el modelo de regresión que mejor explique la relación entre los kilos perdidos  y los días de dieta.
  \item Utilizar el modelo construido para predecir el número de kilos perdidos tras 40
  días de dieta y tras 100 días. ¿Son fiables estas predicciones?
\end{enumerate}

\item Los ingresos por ventas de una empresa (en miles euros) en los últimos años aparecen en la siguiente tabla:
\begin{center}
\begin{tabular}{|c|ccccccccccc|}
\hline
  Año   & 1991 & 1992 & 1993 & 1994 & 1995 & 1996 & 1997 & 1998 & 1999 & 2000 & 2001 \\
\hline
 Ventas & 20 &  25  &  32  &  38  &  38  &  48  &  52  &  56  &  68  &  90  & 100  \\
\hline
\end{tabular}
\end{center}

Se pide:
\begin{enumerate}
\item Dibujar el diagrama de dispersión. ¿Qué tipo de relación
existe entre las ventas y los años?

\item Construir y dibujar el modelo de regresión que mejor explique la relación entre las ventas y los años.

\item Según este modelo, ¿cuales serán los ingresos por ventas esperados para el año 2002? ¿Es fiable la predicción?
\end{enumerate}

\end{enumerate}